金融行业为什么需要做智能投顾?架构难点在哪里?
当前科技金融已经深入到多个业务领域,如量化交易、智能投顾、精准营销、智能客服等,在这些应用中,智能投顾又首当其冲,在财富管理中崭露头角。智能投顾英文名称为robo-advisor,是指网络虚拟人工智能产品基于客户自身的理财需求、资产状况、风险承受能力、风险偏好等因素,运用现代投资组合理论,通过算法搭建数据模型,利用人工智能技术和网络平台提供理财顾问服务,取代传统的人工投资顾问服务。建立智能投顾平台,已经成为金融企业提升竞争力的有力手段。
一、建设背景
随着我国经济社会的快速发展,我国居民家庭财富也稳步增长,同时随着互联网金融的兴起,传统的“有钱存银行”的观念逐渐被“以钱生钱”的理财观念代替,尤其被年轻人所认同。余额宝、陆金所、京东金融等互联网理财产品的诞生对传统金融产生了巨大冲击,为老百姓开拓了新的理财渠道,打开了财富管理市场更大空间的大门。在FinTech的大背景下,智能投顾概念开始在我国兴起,掀起了一波科技金融的创业浪潮,在此冲击下,传统金融机构如广发证券、招商银行、华泰证券等也开始布局智能投顾领域,着手建立自己的智能投顾平台。
二、平台建设
智能投顾的智能之处在于代替人去计算投资策略,这个过程需要有大量的数据事实和算法模型作为支撑,其设计主要参照一下几个标准:
1、用户个性化的风险偏好及变化规律
2、个性化的资产配置方案
3、资产配置方案实时跟踪调整
其架构如下图所示:
整个架构包括四个关键技术点:
1、客户画像
吸引客户理财,不能靠简单地宣传产品,更重要的是能提供针对性的服务,这需要对客户进行全方位的了解,这就需要客户画像。客户画像,是企业通过收集与分析客户的社会属性、行为特征、投资需求、风险承受点等主要数据,抽象出客户的商业全貌。通过客户画像,智能投顾可以根据客户的特点定制相应的投资建议。
客户画像在技术上依赖于大数据技术—其强大的算力可以在海量数据中不断挖掘和归纳用户相关的数据,形成客户标签。其难点在于以下几点:
Ø 数据
客户画像通过对数据的抽象归纳得到人物标签,所以数据集的完整程度直接决定了标签计算结果的准确度。尽可能获得最全的数据集,这是最基础和有难度的工作之一。同时, 随着数据量的增长,TB甚至PB级的数据存储也是亟需解决的难题,传统的关系型数据库已经无法满足海量数据的存储和分析需求,现在各大公司普遍使用大数据平台作为存储和计算的基础。
与客户数据相关的系统包括CRM、资产管理、经纪业务、客服系统、APP等等,这些数据依附于各个系统异构存储,数据量较大,为了方便分析,需要将各类数据统一汇聚到大数据平台(通常为Hive、HBase)中,以业务属性分类存储,以客户ID作为关联关系,在计算层通过大数据技术(通常为Hive、Spark)统一计算并将结果汇总至相应客户中,形成标签信息(通常使用Elasticsearch)。值得注意的是,使用Elasticsearch的原因是Elasticsearch是schema free的系统,使得标签的增加非常方便。数据导入到大数据平台的过程可以通过Sqoop或自主编程的方式实现,均可实现数据增量导入。
Ø 算法
在数据收集完成之后,就要通过算法统计分析用户相关的指标,这需要梳理用户标签及其计算方式,如“高净值客户”、“信用好”等。梳理金融领域的用户标签及其算法,也是一项长期的工作,一个好的标签的诞生往往需要耐心挖掘和灵感。
Ø 时效性
标签都是具有时效性的,一个人上个月是“高净值客户”,这个月可能就不是了,所以标签是需要不断更新的。如何解决这个问题,也是一个不小的挑战,一种简单的方案是定期重算,通常为一天或几天,这种方案虽然简单,但是重算的计算量大,另一种方案是增量更新,这需要按时间区间统计指标值,这样能够保证删除不在时效期内的统计值,只保留时效期的统计指标。无论采用哪种方案,保证标签在时效期内,这是重中之重。
2、产品画像
作为资产配置中另外一个主角,产品(投资标的物)的信息刻画也是重要一环,否则会出现虽然知道客户需求,但是不知道该推荐哪款产品的尴尬境地。每一款产品总会有属于它自己的标签,如风险低、短期收益率高等等,再比如该股票是大盘还是小盘,是价值股还是成长股等等。产品画像刻画得越详细,被成功推荐给合适的客户的概率就越高。
与客户画像一样,产品画像也需要一套相对完善的计算体系实现其标签化。其技术难点与客户画像基本相同。
3、风险管理
银行大厅循环播放的“理财有风险,投资需谨慎”直观地向客户展示着理财与风险的关系,风险越大,收益越高,每个人承受的风险点决定了他能选择的产品范围。风险管理的作用是通过对市场行情波动的分析,充分描述各类理财产品的风险因素,持续跟踪整个理财投资过程中的风险点,使资产配置实现投资策略的实时调整。
风险管理的对象包括人、理财产品、公司等等。人的风险体现在信用级别、负债程度等方面;理财产品的风险体现在投资渠道的风险(股票、债券、基金)以及管理人的风险(基金经理的往往记录)等方面;公司的风险体现在业绩表现、不良记录、竞争对手和合作伙伴的风险。将这些风险的点连接起来会形成面,通过一个风险点,往往会找到潜在的风险点,从而加以预防。
在技术上,风险管理同样需要大数据技术整合相关数据形成风险管理对象的风险因子,同时可以利用图数据库技术,形成各类对象之间的风险关联关系,有利于分析风险之间的潜在传递关系。其技术难点包括:
Ø 风险主体
风险都是有主体的,如交易风险、客户信用风险、产品收益风险,从这点看,风险也算是金融领域主体的标签,也会实时变化,也需要特定的计算公式和数据支撑。所以尽可能全面的梳理风险主体及其关系,是风险管理的一个基础工作和难点工作。
Ø 风险传递和计算
由于主体的关联性,风险也就具备了传递性,通常来说,风险发生点最直接关联的主体都有可能发生风险,当然其他层次也可能会有很多风险点有待挖掘,这需要数据挖掘算法做技术支撑。
4、投资组合
将客户画像、产品画像、风险管理这三类基础数据结合起来,通过算法计算出适合客户的投资模式,这就是资产配置模型。资产配置对投资组合业绩的贡献率达到90%以上,一方面,在半强势有效市场环境下,投资目标的信息、盈利状况、规模,投资品种的特征以及特殊的时间变动因素对投资收益都有影响,因此资产配置可以起到降低风险、提高收益的作用。另一方面,随着投资领域从单一资产扩展到多资产类型、从国内市场扩展到国际市场,其中既包括在国内与国际资产之间的配置,也包括对货币风险的处理等多方面内容,单一资产投资方案难以满足投资需求,资产配置的重要意义与作用逐渐凸显出来,可以帮助投资者降低单一资产的非系统性风险。
资产配置方法可以分为主动和量化两大类,主动类的配置方法例如耶鲁模式,量化类的配置方法包括经典的马克维茨均值方差模型、Black-Litterman 模型、风险平价模型等。资产配置的技术难点是如何确定资产配置算法,需要领域知识和数据模型相结合。
三、未来展望
中国人口基数大,且随着经济社会的快速发展,人民变的更加富裕,传统的理财方式必然会被多元化的理财投资渠道所补充或替代,所以智能投顾的发展空间很大,但是智能投顾发展较晚,很多模式仍需要持续探索。由于智能投顾的发展目标是要让机器代替人为客户提供智能投资建议,所以智能投顾平台的建设重中之重。通过上面对于平台建设的描述,可以预见,客户画像、产品画像、风险管理终将成为一种基础服务和数据资产,不光为智能投顾服务,更可以为其他应用如量化交易、精准营销、智能客服等提供基础数据支撑。而在资产配置方面,策略也会愈加的灵活和个性化,可为客户深度定制投资策略,最终实现真正的智能化投资顾问。
参考资料:
[1]https://www.zhihu.com/question/40505552
[2]https://baike.baidu.com/item/%E8%B5%84%E4%BA%A7%E9%85%8D%E7%BD%AE/5215785
本文作者主要从事大数据方面的研究和应用,对于万亿级结构化和千亿级非结构化数据的存储和查询有良好的实践经验,目前就职于某证券。
延伸阅读:
长按二维码关注公众号